查看原文
其他

系统综述中的统计分析(2/5):Meta分析方法的选择

唐金陵 毛琛 临床研究与循证医学 2022-03-25
本文是“系统综述中的统计分析”全部5集系列的第2集,之前各集的链接见下:

系统综述中的统计分析(1/5): 分析目的和Meta分析原理

目录

第一节 统计分析的目的和方法第二节 Meta分析     一、Meta分析的原理     二、倒方差法     三、Mantel-Haenszel法     四、Peto比值比法     五、固定效应与随机效应模型     六、加权平均方法的比较     七、展示meta分析结果-森林图第三节 异质性及其来源的分析第四节 敏感性分析第五节 发表偏倚的检测和校正第六节 常见meta分析软件的介绍第七节 RevMan分析实例


第二节 Meta分析


三、Mantel-Haenszel法

 Mantel-Haenszel法(简称M-H法)是流行病学资料分析中常用的一种分层分析方法。例如,在前瞻性研究中按照可能的混杂因子将资料分成两个或更多的层,估计每层的效应,并用M-H法的一致性检验检查各层结果的异质性,如果各层效应值的差别没有统计学意义,则可用M-H法将各层的结果合并,得出合并各层的没有混杂的总体效应值。


M-H法用于meta分析时不与上述按照混杂因素进行的分层分析完全相同。在meta分析里,每个独立的研究就相当于一个层,而且合并的目的是获得总体效应,而非控制混杂。除此以外,二者没有区别。众所周知,M-H法适用于结局为分类变量数据的合并。下面我们就以流行病学研究中最常用的二分变量的结局为例,利用表6的数据展示M-H法的计算细节。


表6 结局为二分变量的研究的四格表


假设θi为第i个研究的效应量,如比值比、率比和率差,wi为该研究的权重,那么Mantel-Haenszel加权合并效应量θMH可由以下公式表达:

值得注意的是,因效应测量指标不同,M-H法的权重和合并效应值的标准误计算方法也不同,下面将按照不同的指标分别介绍它们的计算公式。与倒方差法不同的是,当使用比值比和率比作为效应指标时,合并效应值时不需对数转换,但标准误的计算则需要以其对应的对数值为基础。


当效应测量指标为比值比(OR)时,合并效应量(ORMH)、相应权重wi、对数标准误SE[ln(ORMH)]及95%可信区间的计算公式分别为:

其中

合并的比值比对数值的95%可信区间的计算公式为:

合并的比值比的95%可信区间的计算公式为:

当效应测量指标为率比(RR)时,合并效应量(RRMH、相应权重wi、对数标准误SE[ln(RRMH)]的计算公式分别为:


其中


合并的率比对数值的95%可信区间的计算公式为:

合并的率比的95%可信区间的计算公式为:

当效应测量指标为率差(RD)时,合并效应量RDMH相应权重wi、标准误SE(RDMH)的计算公式为:


其中

合并的率差的95%可信区间的计算公式为:


下面以表3中尼古丁替代疗法系统综述的数据为例,展示M-H法计算加权平均值及其可信区间的计算方法。表7列出了该系统综述中的28个研究的基本资料,包括样本量和疗效(OR)。另外wi代表第i个研究的权重;wi%为该研究的权重占所有研究总权重的百分比,反映该研究的效应值对总体效应值贡献的大小;wiθi 是该项研究的权重和效应量之积,无实际意义,主要是为了进一步计算合并OR值使用;R、S、E、F、G、H为计算SE[ln(OR)]值的中间变量,无实际意义,主要为了进一步计算合并OR值的可信区间。合并的比值比的计算步骤如下:




合并的比值比的对数值95%可信区间的计算公式为:

表7 Mantel-Haenszel法计算研究的权重和合并的效应指标示例


四、Peto比值比法

与M-H法一样,Peto法也经常用于流行病资料的分层分析,控制混杂。Peto法一般用于合并比值比,也可以用于合并生存数据中的风险比(hazard ratio,HR)。利用Peto法时,所有计算均须以对数为基础。


结合表6中的变量,Peto法的加权合并效应值ORPeto、相应的权重及其标准误的计算公式如下:

其中


合并比值比对数值的95%可信区间计算公式为:


合并比值比95%可信区间计算公式为:



仍以表3中尼古丁替代疗法系统综述的数据为例,展示Peto法计算加权平均值及其可信区间的计算方法。表8列出了该系统综述中28个研究的基本资料,包括样本量和疗效(OR)。另外wi代表第i个研究的权重;wi%为该研究的权重占所有研究总权重的百分比,反映该研究的效应值对总体效应值贡献的大小;Oi、Ei、Oi-E为计算合并OR值的中间变量,无实际意义。其合并的比值比对数值ln(ORPeto)的计算步骤如下:

合并ln(OR)的标准误为:

合并ln(OR)的95%可信区间为:

经对数转换后OR=1.57,95%CI =(1.41, 1.75


8 Peto法计算研究的权重和合并的效应指标示例


五、固定效应与随机效应模型

至此介绍的各种加权平均法都属于固定效应模型(fixed-effect model)。固定效应模型要求合并的研究具有同一个真实值,即都来自同一个总体,结果不存在异质性,结果之间的差别仅仅是由于抽样误差引起的,且围绕真实值上下随机波动,加权平均结果可以很好地反映真实值。


与固定效应模型相对应的是随机效应模型(random-effect model)。随机效应模型假设合并的研究的真实值是不同的,它们来自不同的总体,结果存在异质性,结果之间的差别由抽样误差和真实差别两个因素引起,且围绕真实平均结果上下随机波动。


一般来讲,固定效应模型适用于合并具有同质性的研究,随机效应模型适用于合并具有异质性的研究。在固定效应模型里,不同研究的结果就如同多个人对同一栋楼高度的测量结果,其真实高度只有一个,是固定的,合并的结果是对该楼高度的估计。在随机效应模型里,不同研究的结果就如同多个人对某个地方多个不同建筑的高度的测量结果,不同楼的真实高度不同,是变化的,合并的都是来自不同人的测量结果,合并的结果是对这些高楼平均高度的估计。有关异质性的详情,参见下一集“异质性分析及其来源”;有关随机效应模型的详情,参见下一集第三部分中“采用随机效应模型进行合并”的内容。



六、加权平均方法的比较

综合上述,meta分析通常可使用的加权平均法有四种:样本含量加权法、通用法(即I-V法)、M-H法,以及Peto法。通用法可用于所有可估计标准误的统计学指标;M-H法多用于基于二分变量的效应指标,包括比值比、率比和率差;Peto法只可用于基于二分变量的Peto比值比及生存数据中风险比的合并。严格来讲,样本含量加权法也属于通用法的一种,但是只有在以上任何一种方法都不合适时,才会考虑使用。当个别研究样本含量太小导致组内结局事件数等于或接近零时,M-H法和Peto法都优于倒方差法,尤其是Peto法。Peto法还要求比较组之间人数接近而且真实比值比接近1。


流行病学很多数据分析的目的是估计关联强度或疗效的大小,多数情况下是基于二分变量的效应指标。在进行meta分析时,由于它们统计学方面的优势,如方差估计的准确性、结果的一致性以及多元回归方程的可行性,一般建议使用相对效应指标,尤其是比值比。因此,选择加权平均法时,首先应考虑M-H法,世界考科蓝组织系统综述分析软件RevMan默认的方法就是M-H法;在合并生存数据的瞬时发生率比或事件数出现零时,可考虑Peto法;在其他情况下,如合并的指标为灵敏度、均数差、率、相关系数、回归系数、基于大样本的比值比等,可选用或只能选用倒方差法。根据不同的数据类型和效应测量指标,现将加权合并的方法总结至框1。


框 1 不同数据类型和效应测量指标的加权合并方法
  • 合并二分类变量中RR和RD时,可选用I-V法和M-H法

  • 合并二分类变量中OR时,可选用I-V法、M-H法和Peto法

  • 合并连续性变量中WMD和SMD时,可选用I-V法

  • 合并生存数据中HR值时,可选用I-V法和Peto法


七、展示meta分析结果:森林图

Meta分析的结果常用森林图(forest plot)展示。仍以表3中尼古丁替代疗法系统综述的数据为例,说明森林图的结构、内容和相关数据的含义(图 1)。该森林图显示了采用固定效应模型M-H法合并了28项尼古丁口胶对比安慰剂/空白治疗比值比的meta分析。图最左侧一列是原始研究的标识(一般是第一作者姓氏和发表年份的组合),由左侧数第二列是尼古丁口胶治疗组戒烟人数和总人数,第三列是安慰剂/空白治疗组戒烟人数和总人数,第四列为meta分析中每个研究的相对权重,第五列是每个研究的效应点估计值及其95%可信区间,效应指标为比值比。尼古丁口胶组与安慰剂/空白治疗组的总人数分别为5275和5331,成功戒烟者总数分别为943和685,总权重为100%,合并比值比为1.58,95%可信区间为:(1.41, 1.76)。


森林图最右侧的图示部分是森林图的核心部分。每条线段代表其左侧对应的研究的比值比及其95%可信区间。线段中间的方块的中心代表比值比的点估计值,方块的大小代表一项研究相对权重的大小。中心上下贯穿整个图的纵轴代表的比值比为1,表示两组结局事件的发生率完全没有区别。如果结果在中心轴的左侧,则表示安慰剂/空白治疗优于尼古丁口胶;相反,则表示尼古丁口胶优于安慰剂/空白治疗。如果一条线(即一个研究的95%CI)完全在中心轴的一侧,则说明两组间的差异有显著统计学意义(P≤0.05);相反,如果一条线穿过中心轴,则说明组间差异没有显著统计学意义(P>0.05)。这里的28项研究的结果中有19项穿过中心的纵轴,说明这些研究的结果单独都没有显著统计学意义。下面的菱形为合并的结果,菱形的左右两端分别表示95%可信区间的下限和上限。合并的总体效应显示尼古丁口胶的戒烟疗效优于安慰剂或空白治疗,差别有显著统计学意义(OR=1.58,95%CI=1.41,1.76,P<0.00001)。另外,左下方的数据显示,异质性检验的χ2=39.31,df=27,P=0.06,I2=31%。有关异质性检验及其结果的解释,参见下一集。针对总体效应检验的Z=7.97,P<0.00001,显示两组差别有显著统计学意义。


图 1 尼古丁替代疗法戒烟效果meta分析的森林图



原文出处:唐金陵, 毛琛. 第三十一章: 系统综述中的统计分析. 见: 李立明 主编. 流行病学. 第一卷. 第三版. 北京: 人民卫生出版社, 2015.


(本文是全文五个部分的第二部分,未完待续)


作者:

唐金陵,广州市妇女儿童医疗中心临床研究总监、香港中文大学荣休教授

毛琛,南方医科大学公共卫生学院流行病学系主任,教授


编辑:杨佩、黄清湄、宋玮琦、王嘉慧、郑嘉臻


往期回顾

系统综述中的统计分析(1/5):分析目的和Meta分析原理随机对照临床试验(1/5):概述唐金陵:流行病学在医学研究和发展中的地位和作用系统综述与Meta分析(1/5):提出研究问题

长按上方二维码关注我们

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存